{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "4fc356de-176b-4239-a597-7b6f878b8f09",
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.\n"
     ]
    }
   ],
   "source": [
    "import pandas as pd\n",
    "import numpy as np\n",
    "import torch\n",
    "from transformers import AutoModelForCausalLM, AutoTokenizer\n",
    "device = \"cuda\" # the device to load the model onto\n",
    "\n",
    "model = AutoModelForCausalLM.from_pretrained(\n",
    "    \"/home/lyz/hf-models/Qwen/Qwen1.5-1.8B-Chat/\",\n",
    "    torch_dtype=\"auto\",\n",
    "    device_map=\"auto\"\n",
    ")\n",
    "tokenizer = AutoTokenizer.from_pretrained(\"/home/lyz/hf-models/Qwen/Qwen1.5-0.5B-Chat/\")\n",
    "\n",
    "prompt = \"Give me a short introduction to large language model.\"\n",
    "messages = [\n",
    "    {\"role\": \"system\", \"content\": \"You are a helpful assistant.\"},\n",
    "    {\"role\": \"user\", \"content\": prompt}\n",
    "]\n",
    "text = tokenizer.apply_chat_template(\n",
    "    messages,\n",
    "    tokenize=False,\n",
    "    add_generation_prompt=True\n",
    ")\n",
    "model_inputs = tokenizer([text], return_tensors=\"pt\").to(device)\n",
    "\n",
    "generated_ids = model.generate(\n",
    "    model_inputs.input_ids,\n",
    "    max_new_tokens=512\n",
    ")\n",
    "generated_ids = [\n",
    "    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)\n",
    "]\n",
    "\n",
    "response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "id": "4390cdf0-4e0e-47e7-8ac4-50a3a7475201",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>table</th>\n",
       "      <th>question</th>\n",
       "      <th>answer</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>30d4b610-6eb7-4dca-a6b5-b42dc091aa4a.table</td>\n",
       "      <td>请问在所有参赛者中，谁是在合并部落（Merged Tribe）阶段被投票淘汰的第一位评委成员？</td>\n",
       "      <td>Viktor Gusev 47.the sport commentator</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>1daed2ed-ff65-44b6-897b-ef76e616d05f.table</td>\n",
       "      <td>请问在2011年爱迪生奖（Edison Awards）中，哪部影片获得了最佳浪漫电影奖项？</td>\n",
       "      <td>在2011年爱迪生奖（Edison Awards）中，最佳浪漫电影奖项没有具体列出获奖影片名称。</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>12916f1d-2fba-4b01-b6fe-acb4aebad7f0.table</td>\n",
       "      <td>请问在所提供的国家列表中，哪一个国家的国内生产总值（GDP）总量是最低的？</td>\n",
       "      <td>Comoros</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>f81876ca-d4ad-46a3-a322-a0e1b47d4991.table</td>\n",
       "      <td>在2001年的电视剧《齐天大圣孙悟空》中，陈冠希饰演的角色叫什么？</td>\n",
       "      <td>Purple Orchid</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>0b5e1eb2-4225-49a2-85f7-e82e62dd029a.table</td>\n",
       "      <td>请问在上述电影列表中，排名第一的电影是哪一部？</td>\n",
       "      <td>排名第一的电影是《Star Wars*》。</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>495</th>\n",
       "      <td>5cefffc1-35da-4f54-8a03-e3ee0f93d896.table</td>\n",
       "      <td>请问在1973年的比赛中，男子组的冠军是谁？</td>\n",
       "      <td>Sweden Bengt Gustafsson</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>496</th>\n",
       "      <td>49fb8179-40e9-4e05-826e-1e32c51495f8.table</td>\n",
       "      <td>请问在1963年，球队在联赛中的最终排名是多少？</td>\n",
       "      <td>4th</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>497</th>\n",
       "      <td>422da020-5866-4074-bdf9-2ec358e45b04.table</td>\n",
       "      <td>请根据以下表格数据，具体提问关于参赛选手Andrea Rothfuss在两次跑步中的排名变化...</td>\n",
       "      <td>参赛选手Andrea Rothfuss在两次跑步中都保持了第一名的排名，没有发生变化。</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>498</th>\n",
       "      <td>dd6e75ca-2742-4834-a595-a96374ea8b28.table</td>\n",
       "      <td>请问在所列出的各支球队中，哪支球队的进球数与失球数差距最大？</td>\n",
       "      <td>Montreal Canadiens</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>499</th>\n",
       "      <td>3974561d-8453-44a1-92aa-1c27acab6bc2.table</td>\n",
       "      <td>Eccard Freiherr von Gablenz在1940年8月15日获得了什么荣誉？</td>\n",
       "      <td>Eccard Freiherr von Gablenz 在1940年8月15日没有获得任何荣誉。</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>500 rows × 3 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "                                          table  \\\n",
       "0    30d4b610-6eb7-4dca-a6b5-b42dc091aa4a.table   \n",
       "1    1daed2ed-ff65-44b6-897b-ef76e616d05f.table   \n",
       "2    12916f1d-2fba-4b01-b6fe-acb4aebad7f0.table   \n",
       "3    f81876ca-d4ad-46a3-a322-a0e1b47d4991.table   \n",
       "4    0b5e1eb2-4225-49a2-85f7-e82e62dd029a.table   \n",
       "..                                          ...   \n",
       "495  5cefffc1-35da-4f54-8a03-e3ee0f93d896.table   \n",
       "496  49fb8179-40e9-4e05-826e-1e32c51495f8.table   \n",
       "497  422da020-5866-4074-bdf9-2ec358e45b04.table   \n",
       "498  dd6e75ca-2742-4834-a595-a96374ea8b28.table   \n",
       "499  3974561d-8453-44a1-92aa-1c27acab6bc2.table   \n",
       "\n",
       "                                              question  \\\n",
       "0      请问在所有参赛者中，谁是在合并部落（Merged Tribe）阶段被投票淘汰的第一位评委成员？   \n",
       "1        请问在2011年爱迪生奖（Edison Awards）中，哪部影片获得了最佳浪漫电影奖项？   \n",
       "2                请问在所提供的国家列表中，哪一个国家的国内生产总值（GDP）总量是最低的？   \n",
       "3                    在2001年的电视剧《齐天大圣孙悟空》中，陈冠希饰演的角色叫什么？   \n",
       "4                              请问在上述电影列表中，排名第一的电影是哪一部？   \n",
       "..                                                 ...   \n",
       "495                             请问在1973年的比赛中，男子组的冠军是谁？   \n",
       "496                           请问在1963年，球队在联赛中的最终排名是多少？   \n",
       "497  请根据以下表格数据，具体提问关于参赛选手Andrea Rothfuss在两次跑步中的排名变化...   \n",
       "498                     请问在所列出的各支球队中，哪支球队的进球数与失球数差距最大？   \n",
       "499     Eccard Freiherr von Gablenz在1940年8月15日获得了什么荣誉？   \n",
       "\n",
       "                                               answer  \n",
       "0               Viktor Gusev 47.the sport commentator  \n",
       "1    在2011年爱迪生奖（Edison Awards）中，最佳浪漫电影奖项没有具体列出获奖影片名称。  \n",
       "2                                             Comoros  \n",
       "3                                       Purple Orchid  \n",
       "4                               排名第一的电影是《Star Wars*》。  \n",
       "..                                                ...  \n",
       "495                           Sweden Bengt Gustafsson  \n",
       "496                                               4th  \n",
       "497       参赛选手Andrea Rothfuss在两次跑步中都保持了第一名的排名，没有发生变化。  \n",
       "498                                Montreal Canadiens  \n",
       "499  Eccard Freiherr von Gablenz 在1940年8月15日没有获得任何荣誉。  \n",
       "\n",
       "[500 rows x 3 columns]"
      ]
     },
     "execution_count": 2,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "train = pd.read_csv('train.csv', sep='\\t')\n",
    "train"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "id": "f04b0257-33be-4465-8103-f53cf3ec3546",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>table</th>\n",
       "      <th>question</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>da418c0c-33cd-4424-9c08-026b5e683fe7.table</td>\n",
       "      <td>在上述表格中，第25至32场比赛中，哪位选手代表欧洲队在单打比赛中战胜了美国队的选手？</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>a601205d-b66c-426c-bc31-18df6ccc6e6f.table</td>\n",
       "      <td>在2001年发行的歌曲 \"Gainesville Rock City\" 中，它在英国音乐排行...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>d0c9dc11-937e-4de1-8939-e5b4e79561a2.table</td>\n",
       "      <td>\"《Arunthathi》这部电影的导演是谁？\"</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>58716f17-d58f-4211-9589-397a0ff73fc5.table</td>\n",
       "      <td>请问《Rainism》这首歌的音频制作导演是谁？</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>53a5d0ba-4b37-45e9-b2d7-565774ad4e0e.table</td>\n",
       "      <td>请问在8月28日与Burnley的比赛中，比赛的最终比分是多少？</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1545</th>\n",
       "      <td>67924d62-6133-4e5c-b790-2fc627e4e93a.table</td>\n",
       "      <td>请根据上表提供的数据，具体描述2007年至2013年间，评分等级为“4”的学生比例在各个年份...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1546</th>\n",
       "      <td>1bd58446-4b88-492f-b91d-a733a9907851.table</td>\n",
       "      <td>请根据表格提供的信息，回答以下问题：第123号球员Paul Ames的NHL队伍是哪一支？</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1547</th>\n",
       "      <td>9047b42a-8ad7-4556-b181-3c8ea16c502f.table</td>\n",
       "      <td>“表格中所列的各个车型中，哪款车型的起始价格最低？”</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1548</th>\n",
       "      <td>ff078d5d-ee99-4156-aa7f-ddcbd159d83d.table</td>\n",
       "      <td>请问在这个表格所列出的音乐作品中，哪一位音乐制作人参与了最多歌曲的制作？</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1549</th>\n",
       "      <td>462375ff-fbec-4a1c-9008-a6999552ad02.table</td>\n",
       "      <td>请问在第3列中，\"US 20/US 26 towards Boise, ID\"这个路线是在哪...</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>1550 rows × 2 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "                                           table  \\\n",
       "0     da418c0c-33cd-4424-9c08-026b5e683fe7.table   \n",
       "1     a601205d-b66c-426c-bc31-18df6ccc6e6f.table   \n",
       "2     d0c9dc11-937e-4de1-8939-e5b4e79561a2.table   \n",
       "3     58716f17-d58f-4211-9589-397a0ff73fc5.table   \n",
       "4     53a5d0ba-4b37-45e9-b2d7-565774ad4e0e.table   \n",
       "...                                          ...   \n",
       "1545  67924d62-6133-4e5c-b790-2fc627e4e93a.table   \n",
       "1546  1bd58446-4b88-492f-b91d-a733a9907851.table   \n",
       "1547  9047b42a-8ad7-4556-b181-3c8ea16c502f.table   \n",
       "1548  ff078d5d-ee99-4156-aa7f-ddcbd159d83d.table   \n",
       "1549  462375ff-fbec-4a1c-9008-a6999552ad02.table   \n",
       "\n",
       "                                               question  \n",
       "0           在上述表格中，第25至32场比赛中，哪位选手代表欧洲队在单打比赛中战胜了美国队的选手？  \n",
       "1     在2001年发行的歌曲 \"Gainesville Rock City\" 中，它在英国音乐排行...  \n",
       "2                              \"《Arunthathi》这部电影的导演是谁？\"  \n",
       "3                              请问《Rainism》这首歌的音频制作导演是谁？  \n",
       "4                      请问在8月28日与Burnley的比赛中，比赛的最终比分是多少？  \n",
       "...                                                 ...  \n",
       "1545  请根据上表提供的数据，具体描述2007年至2013年间，评分等级为“4”的学生比例在各个年份...  \n",
       "1546      请根据表格提供的信息，回答以下问题：第123号球员Paul Ames的NHL队伍是哪一支？  \n",
       "1547                         “表格中所列的各个车型中，哪款车型的起始价格最低？”  \n",
       "1548               请问在这个表格所列出的音乐作品中，哪一位音乐制作人参与了最多歌曲的制作？  \n",
       "1549  请问在第3列中，\"US 20/US 26 towards Boise, ID\"这个路线是在哪...  \n",
       "\n",
       "[1550 rows x 2 columns]"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "test = pd.read_csv('test.csv', sep='\\t')\n",
    "test"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "6558c840-1fc5-48f3-938b-e41d93ec55c1",
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "在上述表格中，第25至32场比赛中，哪位选手代表欧洲队在单打比赛中战胜了美国队的选手？ Mika Koivuniemi。\n",
      "\n",
      "在2001年发行的歌曲 \"Gainesville Rock City\" 中，它在英国音乐排行榜上取得了第几位？  在2001年发行的歌曲 \"Gainesville Rock City\" 中，它在英国音乐排行榜上取得了第78位。\n",
      "\n",
      "\"《Arunthathi》这部电影的导演是谁？\" 电影《阿伦特·坦达》和《德哈斯宾或贾奥蒂马尔》分别于1943年7月2日和1943年3月3日在现代剧院上映。电影《阿\n",
      "\n",
      "请问《Rainism》这首歌的音频制作导演是谁？ KAT-TUN 是日本歌手组合，他们在 2004 年发行了专辑 Rainbow Mini Album，并在同年获得了日本唱片销量冠军。他们的音乐作品包括彩虹迷你专辑中的歌曲 Summary of Johnny's World 和 Kaiz\n",
      "\n",
      "请问在8月28日与Burnley的比赛中，比赛的最终比分是多少？ 3 - 4\n",
      "\n",
      "请问“在当前的官员中，‘主计大臣’（Lord High Treasurer）的职务状态是怎样的？” \"主计大臣”(Lord High Treasurer)的职务状态为在位。\n",
      "\n",
      "请问在1971年发行的哪一首歌曲在美国和加拿大的乡村音乐排行榜上都取得了较好的成绩？ 年份: 1967-1977\n",
      "主要歌曲:\n",
      "- Forbidden Fruit (单曲)\n",
      "- I'd Be Your Fool Again (单曲)\n",
      "- I'm In Love with My Wife (单曲)\n",
      "- You T\n",
      "\n",
      "“根据上表提供的信息，请问 'Queen Mary' 船只在1967年被出售后，它的用途发生了怎样的变化？”  \"Queen Mary\" 在1967年被出售后，其用途转变为一个固定型酒店船。\n",
      "\n",
      "在篮球这项运动中，谁是发明了篮球并被机器人“Danny Defrost-Bot”所纪念的人物？ 在篮球这项运动中，美国发明家詹姆斯·纳什米修斯（James Naismith）是发明了篮球并被机器人“Danny Defrost-Bot”所纪念的人物。他在1891年发明了篮球规则\n",
      "\n",
      "问题：安纳普尔纳I峰（Annapurna I）的首次登顶是在哪一年？ 以上为15座珠穆朗玛峰的信息。它们按照海拔高度从高到低排列，其中最高的是位于尼泊尔与不丹边境的Gasherbrum I（8,080米），其次是Jugal\n",
      "\n",
      "请问“Praslin”地区的面积有多大？ “Praslin”地区的面积是16.0平方公里。\n",
      "\n",
      "请根据下面表格中的信息，回答《Sleeping Beauty and other favourite fairy tales》这本书是哪一年由哪位作者编译并翻译的？ 1982年，Angela Carter(ed. and translator)编写并翻译了《Sleeping Beauty and other favourite fairy tales》。\n",
      "\n",
      "请根据表格中的数据，针对第7列（TDs，即达阵次数），请问1983年至1993年间，哪一年的达阵次数最多？ 1988年的达阵次数最多，为729次。\n",
      "\n",
      "在2003年非洲运动会上，运动员在哪个项目中获得了62.86米的成绩？ 在2003年非洲运动会中，运动员在射箭比赛中获得了62.86米的成绩。\n",
      "\n",
      "《Doctor Zhivago》这部电影是由哪位导演执导的？ Von Ryan's Express\n",
      "\n",
      "在2012/2013赛季，A-League比赛的平均每场比赛观众人数是多少？ A-League比赛的平均每场比赛观众人数是12,707人。\n",
      "\n",
      "请问在这次选举中，共和党和民主党中，哪个党的活跃选民数量更多？ 共和党在此次选举中的活跃选民数量更多，为13,916人，而民主党为21,493人。\n",
      "\n",
      "在1998年的世界半程马拉松锦标赛中，运动员在哪个城市以1小时05分00秒的成绩完成了比赛？ 赫尔辛基，芬兰。\n",
      "\n",
      "在表格中的电影《This Little Piggy》中，演员扮演的角色是什么？ 在电影《This Little Piggy》中，演员Vincent Boyd扮演角色Cabbie。\n",
      "\n",
      "在所提供的表格中，哪位选手在比赛中获得了第一名？ Diana MacManus在比赛中获得了第一名。\n",
      "\n",
      "在上述表格中，第0列未显示，但根据表格内容推测，第0列可能代表的是比赛的序号或者场次。基于此，一个可能的中文提问是：“在 Ohio Stadium • Columbus, OH 举行的第4场比赛，对手是哪支队伍？”  第4场比赛在 Ohio Stadium • Columbus, OH 举行，对手为 Minnesota。因此，正确的中文提问可能是：“在 Ohio Stadium • Columbus, OH 举行的第四场比赛，对手是哪支队伍？”\n",
      "\n",
      "请问第9列“Difference”中的值是如何计算得出的？ Tina Maze, Federica Brignone, Tessa Worley, Denise Karbon, Viktoria Rebensburg, Manuela Mölgg, Manuela Mölgg, Anna Pärson, Taïna Barioz, Elis\n",
      "\n",
      "1970年至2010年期间，我国每年的粗死亡率（每千人）是多少？ 根据给定的数据，我们可以看出，在过去的五十年间（1970年至2020年），中国的总人口从31,000万增长到了38,675万人，增长了约16\n",
      "\n",
      "请问表格中PG7尺寸的螺纹标注的外径尺寸是多少毫米（英寸）？ PG7尺寸的螺纹标注的外径尺寸是12.5毫米（0.492英寸）。\n",
      "\n",
      "在表格中，第4列标注为“Note”，且大多数选手的Note字段都标记为“Q”，请问这里的“Q”代表什么意思？ “Q”在这里代表的是\"qualify\"，表示该选手在这次比赛中已经达到了比赛标准，并且满足了参赛资格的要求。这意味着这个选手在某些方面或特定项目上已经超越了比赛标准，达到了达到比赛水平的状态\n",
      "\n",
      "请问在所列国家中，哪个国家的奖牌总数是2枚，并且其中包括1枚金牌和1枚铜牌？ 荷兰。\n",
      "\n",
      "请问表格中列出的各地区的面积单位“Area (sq miles)”代表的平方公里数值分别是多少？ 各地区的面积单位“Area (sq miles)”代表的平方公里数值分别是：Aberdeen City、Aberdeenshire、Angus、Argyll and Bute、Clackmannanshire、Dumfries and Galloway\n",
      "\n",
      "\"在10月13日与俄亥俄州立大学队的比赛中，守门员Vetter一共完成了多少次扑救？\" - Result: Win, 5-0\n",
      "- Opponent: Union\n",
      "- Goals: Matthews (1)-PP, Keseley (1), Kranz (1), Sanders (1)-PP, Deluce (1)\n",
      "- Goal\n",
      "\n",
      "请提供在“Governor's Cup”赛事中，队伍Coca Cola的比赛得分详情。 Coca Cola 在“Governor's Cup”赛事中的比赛得分为 90-82，由 Askia Jones 打入最高分数（29 分）。\n",
      "\n",
      "请根据以下表格中的信息，针对“Year”这一列，提出一个具体且可回答的中文问题：2007年有哪些摔角选手被引入了名人堂？ The wrestlers who have been inducted into the NWA (National Wrestling Alliance) include:\n",
      "- Gene Anderson: Inducted by Bill Eadie for his posthumous induction and wins in the NWA Mid-Atlantic/Atlantic Coast Tag Team\n",
      "\n",
      "在空手道或其他类似武术体系中，不同级别的kyū（级）对应的第四个Belt Alternate（备用腰带）分别是什么颜色？ 第四级Belt Alternate（备用腰带）的颜色为绿色。\n",
      "\n",
      "在1998/99赛季至2005/06赛季期间，该队伍在4级联赛的3ª组别中的最好排名是第几？ 第5名。\n",
      "\n",
      "请问“Democratic (Córdoba Province)”党派在这次选举中获得了多少张选票？ “Democratic (Córdoba Province)”党派在此次选举中获得了15,3826张选票。\n",
      "\n",
      "请根据表格中的数据，具体询问2007年该队伍在USL PDL联赛常规赛中的排名是多少？ 该队在2007年USL PDL联赛常规赛中的排名是第2名。\n",
      "\n",
      "在1991年的欧洲青年锦标赛中，运动员在希腊塞萨洛尼基的比赛中取得了第10名的成绩，其具体成绩是多少米？ 4.90米\n",
      "\n",
      "请根据表格中提供的信息，针对第3列“U.S.”，具体提问如下：在1986年至2009年间，哪些歌曲在美国的榜单上有具体的排名？ 在1986年至2009年间，在美国的榜单上，共有以下几首歌的具体排名：\n",
      "\n",
      "- \"Strollin' On\"：排名第1\n",
      "- \"In the Springtime\"：排名第2\n",
      "- \"\n",
      "\n",
      "请问Whitworth尺寸为1/16英寸的螺纹，其核心直径是多少英寸？ 核心直径为0.0411英寸。\n",
      "\n",
      "|请问在1981年及以后的硬币中，50 seniti硬币的背面图案是什么？| 在1981年及以后的硬币中，50 seniti硬币的背面图案是国王。\n",
      "\n",
      "在表格中，“Notable as”这一列提到的职业或身份下，关于“Sheriff Lupe Valdez”，她的主要职业是什么？ Name: Max Valiquette\n",
      "Lifetime: 1973-1998\n",
      "Nationality: Canadian\n",
      "Notable as: Pop culture expert and television personality\n",
      "\n",
      "Note: The list does not include Max Valiquette from the given\n",
      "\n",
      "请问在2012年至2013年间，各个国家和地区的电影票房收入分别是多少？ 在中国、日本、韩国、英国、法国、俄罗斯、澳大利亚、意大利、巴西和世界共有12个国家和地区参与了2012年至2013年的全球电影市场。以下是各国和地区的具体票房数据：\n",
      "\n",
      "1.\n",
      "\n",
      "请问在2006年的“世界汽车大奖”中，哪些车型被提名为“世界性能车”？ 宝马3-Series, Mazda MX-5, Porsche Cayman S, BMW 1-Series, Honda Civic and Honda Civic Hybrid, Land Rover Range Rover Sport, Lexus IS, Mercedes-Benz M-Class, Mercedes-Benz S-Class, Suzuki Swift, Volkswagen Pass\n",
      "\n",
      "“在珍珠港事件中，‘Oklahoma’号战舰的状态如何？它受到了什么程度的损伤？” - Pennsylvania: Damaged (damaged in dry dock No. 1)\n",
      "- Arizona: Sunk (total loss, moored Battleship row, berth F-7 forward of Nevada aft of Tennessee)\n",
      "- Nevada: Sunk (total loss\n",
      "\n",
      "在\"Coca-Cola Classic\"比赛中，获胜者是如何通过加洞赛战胜对手的？ No. 10 and 23: Women's International Championship, played in 1979 at the Colgate Far East Open and the Sahara National Pro-Am, respectively. In these tournaments, Jo Ann Washam emerged as the champion\n",
      "\n",
      "在1971年至2014年间，每年的比赛中，哪一场比赛的得分差距最小？ 2014年斯坦福对阵圣佛朗西斯科的比赛是得分差距最小的一场比赛，相差了24-13分。\n",
      "\n",
      "请问在2007年至2011年间，运动员在不同赛事和项目中取得的具体名次有哪些？ 在2007年至2011年间，运动员在以下各项赛事和项目中取得的具体名次：\n",
      "- Pan Arab Games：4th（200 m）和5th（100 m）\n",
      "- Asian Indoor\n",
      "\n",
      "请问巴西国家足球队在1968年的欧洲巡演期间，他们的队服上佩戴了几颗星？ 巴西国家足球队在1968年的欧洲巡演期间佩戴了2颗星星。他们在欧洲巡演中短暂地佩戴了2颗星星，在1968年的一次欧洲之旅中，他们曾在1968\n",
      "\n",
      "请问在历次选举中，基督民主人民党（Partidul Popular Creştin Democrat，简称PPCD）在1998年3月22日的选举中获得了多少张选票？  在1998年3月22日的选举中，Christ Democratic People's Party（基督教民主人民党）获得了133,606张选票。这个数字代表了该政党在这场选举中的得票\n",
      "\n",
      "请问“Air Florida”航空公司在1979年至1982年期间，分别在美国哪些日期提供飞往纽约JFK、坦帕和华盛顿国家机场的航班服务？ Atlantic Southeast Airlines is the airline that serves destinations in Cincinnati, Atlanta, and Cleveland, with aircraft of various types including ATR 72, CRJ-200, and CRJ-700. The airline operates under the names\n",
      "\n",
      "在2011年7月18日在巴西里贝朗普雷图举行的比赛中，对阵Vivian Segnini的比赛中，选手获得了怎样的比分？ 6-2, 6-2\n",
      "\n",
      "\"在上述奖牌榜中，排名第4的国家Kenya在金牌、银牌和铜牌方面各获得了多少枚奖牌？\" Kenya在金牌、银牌和铜牌方面各获得3枚奖牌。\n",
      "\n",
      "关于第3列中的 \"The martyr's remix\" 版本，它的混音特点是什么，与原版相比有哪些不同之处？ \"The martyr's remix\" 版本包含了所有专辑版本的歌词，并且在音乐上具有硬摇滚的Sonorities，其中许多吉他旋律出现在复杂数个反复出现的歌曲段落中。相比于原版，它减少了\n",
      "\n",
      "在2005年举行的ALBA Games比赛中，运动员在 Hammer 项目中取得了多少米的成绩？ 63.30米。\n",
      "\n",
      "请问在1970年至2013年期间，每年的赛车比赛中谁是获胜者？ The years listed in the table represent the dates on which various car manufacturers won the Indianapolis 500 race. The results for each year are provided below:\n",
      "- 1970: Dave Sorg (Mercury) is the winner of\n",
      "\n",
      "请问表格中的第一列“Name”代表的是什么名称？ The given table lists the names of locomotives with their type, builder, works number, date of construction, notes, and fate. Here is a brief overview of some of these locomotives:\n",
      "- Driver: A 0-4-\n",
      "\n",
      "请问“Canal de las Estrellas”电视台的主要节目类型是什么？ “Canal de las Estrellas”电视台的主要节目类型包括soap operas, retro movies, and sports。\n",
      "\n",
      "在下午2pm至3pm的时间段内，周三的节目“Defcon 3”由哪位主持人主持？ Defcon 3 的主持人是 Kathleen Troia McFarland。\n",
      "\n",
      "在新墨西哥州政府中，谁是现任的Secretary of State？ Dianna Duran是现任的新墨西哥州SECRETARY OF STATE。\n",
      "\n",
      "请问在本次高尔夫比赛中，排名第一位的是哪位选手，他来自哪个国家，并且他的总得分是多少？ 排名第一位的是Dustin Johnson，他来自美国，总得分是207分。\n",
      "\n",
      "在2008年1月27日结束的那个周末，电影《兰博》的周末票房收入是多少？ National Treasure: Book of Secrets and Transformers 3: Revenge of the Fallen are the two highest-grossing films of 2008, with $1.65 million and $2.26 million respectively. In contrast, films\n",
      "\n",
      "请提供具体信息，以便我能为您生成一个关于表格中第三列“Notable works for piano”的具体中文提问。例如，您想针对哪位作曲家或者哪部作品提问？ - Roy Agnew was an Australian composer born in 1891 and died in 1944.\n",
      "- Theodore Akimenko (ru), born in 1876, is a Russian-Ukrainian composer who is\n",
      "\n",
      "在2002年至2003年间，美国消费品安全委员会（CPSC）对玩具安全的资金投入有何变化？  在2002年到2003年间，美国消费品安全委员会（CPSC）对玩具安全的资金投入减少了约12%。这个下降主要是由于没有足够的数据来更新和评估玩具安全项目的支出情况，因此\n",
      "\n",
      "请根据下表中的数据，具体提问关于投票结果的问题：在本次选举中，哪个政党的候选人获得了最高的投票百分比？ 哪个政党的候选人获得了最高投票百分比，即30.2%。\n",
      "\n",
      "请问在这次比赛中，并列第四名的五位选手分别是哪五位？ 在上述比赛中并列第四名的五位选手是：T4（Bob Gilder）；T4（Tom Kite）；T4（Jack Nicklaus）和Greg Norman。他们分别以70、71、6\n",
      "\n",
      "请提供1996年至2003年间，在不同比赛中，该运动员所获得的具体名次及其对应的成绩。 1996年：世界少年锦标赛（World Junior Championships）- 15th；亚洲少年锦标赛（Asian Junior Championships）- 1st；2001年：东亚运动会（East Asian Games）- 3rd\n",
      "\n",
      "请根据下表中的数据，提问：在这次比赛中，排名首位的阿尔及利亚获得了多少枚金牌？ 阿尔及利亚获得了11枚金牌。\n",
      "\n",
      "请提供1981-2012年间每个赛季的具体联赛进球最多球员是谁？ 丹麦足球历史上最著名的顶级射手是克里斯蒂安·克里斯托弗森（Christian Christensen），他在1981-82、1983-84、1984-85、1986\n",
      "\n",
      "请根据以下表格中的信息，提供具体且可回答的中文提问：在列出的教练中，哪位教练在2012年1月1日至2012年6月30日期间担任教练，并且在此期间获得了升入第三级别的荣誉？ 在列于的教练中，John 'Tune' Kristiansen 在2012年1月1日至2012年6月30日期间担任教练，并在此期间获得了升入第三级荣誉。\n",
      "\n",
      "请问表格中的第0列“P.S. #”代表的是什么编号或标识？ 学校名称：Black Rock、Babcock、Babcock、Genesee Moselle、First Ward、Downtown、Lakeview、Masten Park、Schiller Park、Willert Park、North Park、Bryant、Central\n",
      "\n",
      "在2001-2002赛季的欧洲联盟杯（UEFA Cup）资格赛（QR）中，CSKA Sofia在两回合的比赛中的具体比分是多少？ CSKA Sofia在2001-02赛季的欧洲联盟杯资格赛（QR）中，第一轮比赛以1-2（H）的比分输给了Nistru Otaci，第二轮比赛又以1-\n",
      "\n",
      "\"在2013年的比赛中，第六个举办 venue 的城市是哪里？\" \"北京\"\n",
      "\n",
      "请提供2001年至2012年间，乐队在不同年份发布的专辑名称及其发行时间和所属唱片公司，以及这些专辑在美国Billboard 200、美国基督教音乐榜和美国Heatseekers榜单中的最高排名情况。 - 2001年：The Moon Is Down，由Tooth & Nail标签发行，是乐队在该年发布的第1张录音室专辑，歌曲《Moon Is Down》在该年取得了第133名的\n",
      "\n",
      "请问 \"Santa Barbara International Film Festival\" 在哪一天至哪一天举行，并且这个电影节的地点在哪里？  \"Santa Barbara International Film Festival\" 于2月2日至5日、5月11日至22日在美国加利福尼亚州圣巴巴拉市举行。这个电影节获得了\"Top 11 'Best of the Fest'\n",
      "\n",
      "请提供1989年至1995年间，歌手在“US R&B”、“US Pop”和“US Dance”三个榜单上的具体排名变化情况。 根据资料，1989年到1995年期间，歌手在“US R&B”榜单上的具体排名变化如下：\n",
      "- 第一年：该年度并未在“US R&B”榜单上出现任何音乐作品，\n",
      "\n",
      "请问在1963年，由玛丽·昆特（Mary Quant）和里德·克劳福德（Reed Crawford）设计的灰色羊毛“Rex Harrison”围裙裙和奶油色衬衫，是被哪个时尚协会的成员选为年度时尚的吗？ 1963年：Mary Quant Reed Crawford设计的帽子是Anello & Davide的皮草\"Rex Harrison\"款式。这件皮草连衣裙和奶油色衬衫由Grey wool \"Rex Harrison\"面料制成，\n",
      "\n",
      "请提供“Notes”列中关于“Dot”机车的具体信息，它是何时捐赠给博物馆的？ “Dot”机车在1961年由Beyer Peacock捐赠给了博物馆。\n",
      "\n",
      "请提供1981年至1998年间，某球队在每个赛季的具体排名情况。 1981-1988年间，某球队在各赛季的具体排名如下：\n",
      "- 第一赛季：1981年-1982年，该队位于第17名；\n",
      "- 第二个赛季：\n",
      "\n",
      "\"Canal de las Estrellas、Canal 5、Azteca 7、Galavisión、Once TV、Azteca 13这六个频道中，哪一个频道的拥有者是Televisa公司？\" The channel owned by Televisa is Canal de las Estrellas.\n",
      "\n",
      "请问在1999年至2010年期间，芬兰足球联赛中各个赛季的升降级情况如何？ 1999年至2010年期间，芬兰足球联赛共有以下六个升降级赛季：\n",
      "- 1999赛季：第2轮，Kakkonen (Second Division) 被Relegated到第二集团\n",
      "\n",
      "请问在这次比赛中，排在第五位的Tang Xiaoyin（中国）的用时是多少？ 53.66秒。\n",
      "\n",
      "请问在每天上午10:15分播放的节目“Você na TV (You on TV)”是属于什么类型的节目？ Tuesday: Breakfast news show, talk show, soap opera, reality show.\n",
      "Wednesday: Evening news show, talk show, soap opera, reality show.\n",
      "Thursday: Morning news show, talk show, soap opera, reality show.\n",
      "Friday: Evening news show\n",
      "\n",
      "在1948年12月11日的比赛中，对阵DePaul队时，比赛的具体得分是多少？ 60分\n",
      "\n",
      "在2003年，参加NASCAR系列赛的驾驶员使用了什么类型的赛车？ Tony Stewart 使用了Stock car。\n",
      "\n",
      "请问在表格中列举的各个项目中，哪些运动员获得了金牌？ Giant slalom：B1-2 details - Eric Villalon Guide: Pere Comet Spain (ESP)\n",
      "Giant slalom：B3 details - Yon Santacana Guide: Raul Capdevila Spain (ESP)\n",
      "\n",
      "在1990年的电视剧《The Days and Nights of Molly Dodd》中，演员在该剧的某一集中扮演了什么角色？ 《The Days and Nights of Molly Dodd》是1990年的电视系列剧，由Trent主演。《Dangerous Music》是一部短片，于1991年上映，由Tyler主演。《The Bet》是一部\n",
      "\n",
      "请提供1850年至2011年期间，各个年份在总人口中罗马尼亚人、匈牙利人和罗姆人（ Roma）所占比例的具体数据。 1850年：罗马尼亚人占45.41%，匈牙利人占23.9%，罗姆人占6.5%。\n",
      "1880年：罗马尼亚人占46.36\n",
      "\n",
      "请问，“Ballymena Showgrounds”和“New Grosvenor Stadium”这两个并列第三的球场分别位于哪两个城市？ Stirling Park 5,000 capacity stadium in Belfast, Northern Ireland. It is the home of Linfield and Glentoran football clubs.\n",
      "\n"
     ]
    }
   ],
   "source": [
    "test_answer = []\n",
    "for row in test.iterrows():\n",
    "    content  = ''.join(open('tables/' + row[1].table).readlines()[:50])\n",
    "    prompt_template = f'请结合给定的资料客观回答问题，如果问题无法从表中回答则回复无法回答，回答结果要精简，简短直接回答结果，不要分析如何回答的，直接回答，出了答案之外不需要有其他内容。\\n -资料\\n {content} -提问 \\n {row[1].question}'\n",
    "\n",
    "    messages = [\n",
    "        {\"role\": \"user\", \"content\": prompt_template[:4096]}\n",
    "    ]\n",
    "    text = tokenizer.apply_chat_template(\n",
    "        messages,\n",
    "        tokenize=False,\n",
    "        add_generation_prompt=True\n",
    "    )\n",
    "    model_inputs = tokenizer([text], return_tensors=\"pt\").to(device)\n",
    "\n",
    "    with torch.no_grad():\n",
    "        generated_ids = model.generate(\n",
    "            model_inputs.input_ids,\n",
    "            max_new_tokens=50\n",
    "        )\n",
    "        generated_ids = [\n",
    "            output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)\n",
    "        ]\n",
    "        \n",
    "        response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]\n",
    "\n",
    "    print(row[1].question, response)\n",
    "    print('')\n",
    "    test_answer.append(response.strip().replace('\\n', ''))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "id": "c6e3dc34-af5a-4c6b-9461-b3d68f733dd1",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "1550"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(test_answer)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "id": "4a67b7d3-47a5-4659-84e8-bac0c57b446a",
   "metadata": {},
   "outputs": [],
   "source": [
    "pd.DataFrame({'answer': test_answer}).to_csv('submit.csv', index=None)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "e0c5ff4d-4142-4030-abfe-2a2a8405de81",
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "py3.11",
   "language": "python",
   "name": "py3.11"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.11.8"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}
